5. densité de l’âge de la clientèle d’euromarket.

En regroupant les données par âge, on obtient :

 

âge

effectif

âge

effectif

âge

effectif

âge

effectif

24

1

35

1

46

0

57

1

25

0

36

1

47

0

58

0

26

1

37

3

48

3

59

0

27

0

38

3

49

0

60

0

28

1

39

5

50

0

61

0

29

3

40

4

51

1

62

1

30

1

41

3

52

0

63

0

31

2

42

3

53

1

64

0

32

0

43

2

54

0

65

0

33

2

44

0

55

0

66

0

34

3

45

2

56

0

67

2

Les données se présentent alors sous la forme de données groupées. Les formules correspondantes donnent les résultats suivants :

m = 40.06, s2 = 87.26, s = 9.34.

La répartition suivant la première règle donnée en cours consiste à définir les classes illustrées ci-dessous :

Il y a un déficit de très petites valeurs par rapport aux pourcentages théoriques de la loi normale, compensé par un effectif élevé de valeurs comprises entre 21.38 et 30.72. Les grandes et très grandes valeurs sont aussi réparties irrégulièrement, mais on trouve 12% de valeurs supérieures à m + s = 49.4, ce qui est un pourcentage normal. 

Il n’est pas très facile de choisir une valeur pour la médiane à cause du nombre de clients de 39 ans. On a 27 clients d’âge inférieur ou égal à 39 et 28 d’âge supérieur ou égal à 39 ans.  39 ans nous paraît la meilleure valeur de la médiane. Le problème est analogue pour calculer les quintiles que l’on peut fixer comme les bornes des classes ci-dessous :

Classe

effectif

Classe

effectif

[ 24.0 , 33.5 [

11

[ 38.5 , 40.5 [

9

[ 33.5 , 38.5 [

11

[ 40.5 , 46.5 [

10

 

 

[ 46.5 , 68.0 [

9

Nous donnons ci-dessous la répartition et l’histogramme suivant les classes fixées :

Classe

eff.

%

Densité

Classe

eff.

%

Densité

[ 20, 30 [

6

12

0.012

[ 40, 50 [

17

34

0.034

[ 30, 40 [

21

42

0.042

[ 50, 60 [

3

6

0.006

 

 

 

 

[ 60, 70 [

3

6

0.006

 

Histogramme de l’âge (5 classes de même amplitude)

L’histogramme montre une légère asymétrie de la répartition de l’âge et diffère de la courbe en cloche par les petites valeurs.

Cette asymétrie est effectivement mise en évidence par la taille du coefficient d’asymétrie qui est nettement supérieur à 0. La répartition donnée en première question explique en outre pourquoi ce coefficient d’asymétrie est largement positif : le nombre de valeurs supérieures ou très supérieures à la moyenne est plus grand que le nombre de valeurs inférieures.

Le coefficient d’aplatissement est plus difficile à interpréter, du fait en particulier de l’asymétrie de la répartition.

La répartition des 50 observations est donc assez différente de la loi normale ; l’histogramme et la courbe en cloche diffèrent surtout par les petites valeurs .